Manipulation de données bibliométrique via {managHAL}

Martin AMIENS

MIA - Paris-Saclay

2024-04-07

Martin AMIENS

  • Stagiaire au sein de l’unité MIA - Paris-Saclay.
  • Etudiant en première année du master Bio-Informatique et Bio-Statistiques à Paris-Saclay.
  • Tuteurs : Julie AUBERT, Pierre BARBILLON

Contexte

  • DRIT : Direction des Recherches et de l’Innovation Technologique
  • Sciences Ouvertes : “est la diffusion sans entrave des publications et des données de la recherche.” (Webmestre,2021)
  • HAL : Hyper Articles en Ligne

Crédit : CCSDForge

Objectifs du stage

  • Accessibilité et généricité de {managHAL}
  • Ajout de fonctionnalité à {managHAL}

Accessibilité et généricité de {managHAL}

Accessibilité et généricité de {managHAL}

faire un tibble des resultats obtenus avec quelques fonctions présentes dans le package (parler vite fait de pourquoi c’est générique (identifiant structure))

# A tibble: 3 × 13
  civilite nom       prenom statut rattachement  debut_contrat fin_contrat
  <chr>    <chr>     <chr>  <chr>  <chr>         <chr>         <chr>      
1 M.       ADJAKOSSA Éric   CEC    AgroParisTech ""            ""         
2 Mme      AUBERT    Julie  IR     INRAE         ""            ""         
3 M.       BARBILLON Pierre PR     AgroParisTech ""            ""         
# ℹ 6 more variables: financement <chr>, equipe <chr>, unite <chr>,
#   orcid <chr>, idhal <dbl>, adresse_mail <chr>
# A tibble: 1 × 11
    docid halId_s      version_i docType_s citationFull_s          citationRef_s
    <int> <chr>            <int> <chr>     <chr>                   <chr>        
1 4440523 hal-04440523         1 COMM      Isabelle Lebert, Maxim… Colloque fin…
# ℹ 5 more variables: publicationDate_tdate <chr>,
#   authFullNamePersonIDIDHal_fs <chr>, structAcronym_s <chr>,
#   structId_i <chr>, structHasAlphaAuthIdHalPersonid_fs <chr>
# A tibble: 1 × 1
  X.error..msg.Error..See.help.....docs..
  <lgl>                                  
1 NA                                     

Réseaux et modèle de graphe aléatoire

Un réseau est composé de :

  • noeuds (entités)

  • arêtes (interactions entre ces entités)

\[\begin{align*} Y_{ij} \neq 0 & \quad \text{si un lien existe entre les nœuds } i \text{ et } j, \\ Y_{ij} = 0 & \quad \text{si aucun lien n'existe entre les nœuds } i \text{ et } j. \end{align*}\]

réseau trophique

réseau de gènes

réseau autre

Ajout de fonctionnalité à {managHAL}

montrer la construction d’un réseau à partir des données (mettre l’interactif, le grand et le petit l’un après l’autre)

Ajout de fonctionnalité à {managHAL}

dire qu’il est possible de réaliser des modèles à partir de ces données (sans expliquer), juste une phrase sur on regroupe les noeuds par profils de connexion similaire. Montrer les deux graphes obtenus avec couleur via sbm.

Discussion, Perspectives et avenir du package

parler des limitations vu par rapport aux quatres graphes précédents, comment je peux les régler (analyses sur composantes connexe), parler du développement du package et de ce qui sera disponible, la finalité du stage.

Merci de m’avoir écouté

Questions ?

Méthodes informatiques

ne faire que si j’ai le temps, les mettres dans les diapos de questions possible ? parler version Rstudio, package utilisés, explication de …

quelles sont les questions qui peuvent venir au cours de ma présentation,

quelles sont les choses dont je n’ai pas parlé au cours de ma présentation,

sources

https://www.ouvrirlascience.fr/plan-national-pour-la-science-ouverte/